Este documento generado (con script de Rmarkdown) está pensado para comparar dos bases de datos de Airbnb y poder evaluar los métodos de scraping. Puedes ver el script original

Más información sobre el taller Datos de la turistificación en Madrid del proyecto Efecto Airbnb.

¿Qué anuncios tienen en común? ¿cuáles no?

Estas son las bases de datos sobre el mapa

Comparando datasets

InsideAirbnb tiene 16313 anuncios.

Datahippo tiene 19655 anuncios.

A. InsideAirbnb y Datahippo tienen 14398 anuncios comunes.

B. La InsideAirbnb tiene 1915 anuncios que no están en la Datahippo.

C. La Datahippo tiene 5257 anuncios que no están en la InsideAirbnb.

Hay, por tanto 21570 anuncios (A + B + C) diferentes en total entre las dos bases de datos. Que concuerda con el valor 21570, que son el número de valores de id únicos entre DB1 y DB2.

InsideAirbnb tiene 75.6% de los anuncios combinados de las dos bases de datos.

Datahippo tiene 91.1% de los anuncios combinados de las dos bases de datos.

Lista de anuncios que no están en las dos bases de datos

Estos son los anuncios que están en InsideAirbnb pero no en Datahippo:

Estos son los anuncios que están en Datahippo pero no en InsideAirbnb:

Datos

InsideAirbnb

  • InsideAirbnb.com de Madrid
  • Fecha scraping: 2018-01-17

Datahippo

  • Datahippo.org
  • Fecha scraping: 2018-04-18